科研 | Aging:基于机器学习的动态代谢分析揭示大鼠尿液中衰老相关标志物(国人佳作)
轻松关注不迷路
编译:微科盟红烧大肥鸥,编辑:微科盟Tracy、江舜尧。
微科盟原创微文,欢迎转发转载。
衰老和新陈代谢过程是紧密交织在一起的;因此,开发与新陈代谢相关的生物标志物是延缓衰老的关键。然而,很少有基于机器学习的研究能发现衰老轨迹的可靠标记物。我们利用超高效液相色谱/质谱技术从大鼠尿液中生成代谢谱,而代谢谱是在训练组和试验组大鼠年龄的四个阶段(20、50、75和100周)动态生成的。偏最小二乘判别分析得分曲线图表明训练组和测试组随着年龄的增长,在一个方向上呈现出完美的分离轨迹。在训练组中,我们通过结合四种算法(VIP、时间序列、LASSO和SVM-RFE)进一步筛选出25个与衰老相关的生物标志物。本研究最后鉴定出6种与衰老相关的代谢物(已知或新的),包括肾上腺素、戊二酰肉碱、L-犬尿氨酸、牛磺酸、3-羟基十二碳二酸和N-乙酰瓜氨酸。我们还发现除N-乙酰瓜氨酸外(p<0.05),100周时无瘤大鼠和荷瘤大鼠之间与衰老相关的代谢物没有差异(p>0.05)。我们的发现揭示了衰老的代谢轨迹,并为潜在的抗衰老治疗靶点提供了新的生物标志物。
论文ID
原名:Aging-related markers in rat urine revealed by dynamic metabolic
profiling using machine learning
译名:基于机器学习的动态代谢分析揭示大鼠尿液中衰老相关标志物期刊:Aging
IF:4.831发表时间:2021.05通讯作者:牛玉存
通讯作者单位:哈尔滨医科大学
实验设计
实验结果
在本研究中,训练组包括60只雄性Wistar大鼠,试验组包括30只雄性Wistar大鼠。他们从8周开始被喂食颗粒状食物,训练组和试验组大鼠随年龄增长的摄食量和体重轨迹如图1A和1B所示。训练组和试验组的食物摄入量都随着年龄的增长而波动(图1A)。训练组前58周体重随年龄增长而增加,然后慢慢稳定下来,从93周开始下降(图1B)。这种下降趋势随着年龄的增长而持续(数据未显示),表明这些大鼠进入了脆弱状态。试验组也观察到了类似的结果(图1B)。此外,在100周时,共有43只大鼠自然死亡(数据未显示),进一步表明这些大鼠在100周时进入衰老阶段。与试验组相比,训练组的平均摄食量较低(p<0.05),但体重无统计学差异(p>0.05)(图1A和1B)。
(A)训练组和测试组的食物摄入量。(初始样本量:训练组n= 60;测试组n = 30)。(B)训练组和测试组的体重。(初始样本量:训练组n = 60;测试组n = 30)。训练组大鼠在(C)25周、(D)50周、(E)75周、(F)100周的负离子电喷雾电离 (ESI-)模式下,获得具有代表性的基峰强度色谱图(BPI)。UPLC-Q-TOF-MS测得的尿液PLS-DA积分图(G)左为阴性,(H)右为阳性。(每个时间点n=24)。 在研究期间,我们对动态采集的训练组大鼠尿液进行代谢组学分析,并采用超高效液相色谱-串联四极杆飞行时间质谱(UPLC-Q-TOF-MS)进行检测。我们进行了主成分分析,包括正负离子模式下质量控制样本(QC)和训练组时间数据的实验样品。图1C-1F显示了四个时间点的代表性基峰强度色谱图。本研究使用训练组原始数据的“80%规则”过滤标准,并导出了负离子模式下的10729个代谢物列表和正离子模式下的27962个代谢物列表,用于随后的多变量统计分析。基于所有代谢物电喷雾电离(ESI+和ESI−)所得到的偏最小二乘判别分析得分曲线图显示了一个方向、不同时间点和随年龄增长的完美分离轨迹(图1G和1H)。总而言之,这些结果表明在衰老过程中会发生代谢重塑,导致尿液代谢物的改变。
2. 基于时间序列分析的代谢物老化轨迹
为了动态识别与年龄相关的代谢轨迹,我们进行了时间序列分析,并根据负模式和正模式下的代谢物老化轨迹预定义了九个簇(图2A)。考虑到尽可能多与年龄相关的代谢物,我们选择了负离子模式下包含60.8%代谢物的第1、3、5、7、8和9组,以及正离子模式下第3、4、7和8组中71%的代谢物,因为这些簇往往表现出与年龄相关的代谢物增加或减少,且这些代谢物可能对衰老敏感。
(A)代谢衰老轨迹。所有10729种代谢物丰度的模糊c均值聚类。集群的平均趋势用黑线表示。(B)25周和100周大鼠尿液PLS-DA积分图。(ESI−,R2=0.881,Q2=0.8)。(每个时间点n=24)。(C)PLS-DA得分图2个主成分的排列检验。(D)维恩图结合两种算法显示出代谢物的重叠。
为了进一步缩小与年龄相关的代谢物范围,本研究针对ESI-和ESI +模式绘制了两个时间点(25周和100周)之间的PLS-DA得分。图2B显示了两个时间点之间的清晰分隔,并已通过置换测试得到了验证,这反映在左边的所有R2X和Q2值都低于最左边的原始点(图2C)。根据PLS-DA得分下的VIP值(VIP> 1.0)我们共选择了ESI-模式下的1251种代谢物和ESI +模式下的2907种代谢物,其中ESI-模式下的1091种和ESI +模式下的1559种代谢物与时间序列数据重叠(图2D)。接下来,我们试图确定尿液代谢物图谱是否存在保守的变化,并在试验组中进行了平行分析。使用测试组原始数据的“80%规则”过滤标准,我们得出了9008个负离子模式代谢物和24951个正离子模式代谢物的列表,用于随后的多变量统计分析。
3. 基于机器学习的衰老相关代谢物筛选
考虑到数据具有小样本和高维的特点,接下来我们基于1091种代谢物(在ESI−模式下)或1559种代谢物(在ESI+模式下),结合两种不同的机器学习算法来选择与衰老相关的代谢物,用于分类25周和100周。首先,我们使用LASSO算法来缩小训练队列中与衰老相关的代谢物范围(图3A)。对于LASSO惩罚回归模型,我们通过寻找分类误差最小的λ来确定变量。本研究共筛选出14种代谢物(ESI−模式)和16种的代谢物(ESI+模式)。我们还应用了SVM-RFE算法来选择与衰老相关的代谢物(图3B)。SVM-RFE算法根据SVM分类器计算出的特征值逐个剔除变量来选择特征代谢物。为了获得这两种方法交叉生成的更多数据,我们根据ESI−或ESI+模式下的特征值选择了排名前300种的代谢物,结合LASSO和SVMRFE算法,联合鉴定了300种与衰老相关的代谢物(ESI−模式)和305种与衰老相关的代谢物(ESI+模式),其中14种ESI−模式和11种ESI+模式代谢物作为候选代谢物并被两种算法同时选择(图3C)。此外,我们使用受试者工作特征曲线分析,将这些候选代谢物应用于预测测试队列中的衰老状态。我们发现这些代谢物在测试队列中很好地区分了年轻和老年状态,并且ESI−或ESI+模式下其曲线下面积为1(图3D),这表明这25种候选代谢物可能是很好的衰老预测指标。热图显示了25种候选代谢物(图3E),反映了旧阶段代谢的剧烈变化。
(A)训练组中的最小绝对值收敛和选择因子(LASSO)算法。(B)训练组采用支持向量机递归特征消除(SVMRFE)算法。(C)维恩图结合两种算法显示了代谢物的重叠。(D)用受试者工作特征(ROC)曲线分析对训练组检测到的14种候选代谢物进行了验证。(E)对训练组中同时从LASSO算法和SVM-RFE算法中选择25种正负离子模式下的代谢物进行聚类分析。
4. 衰老相关生物标志物的鉴定
本研究利用MassFragment软件对25个与衰老相关的候选代谢物保留时间、精确质量和串联质谱碎片图谱与标准品进行了比较,从而确定了这些候选代谢物。本研究共鉴定出6种代谢物(表1),这些代谢物在正负两种模式下的丰度如图4A-4L所示。在训练和测试队列中,25周龄大鼠的肾上腺素和戊二酰肉碱水平显著高于100周龄大鼠,而25周龄大鼠的L-犬尿氨酸、N-乙酰瓜氨酸、牛磺酸和3-羟基十二烷二酸水平显著低于100周龄大鼠(图4A-4L)。在训练和测试队列中,25周龄大鼠的肾上腺素和戊二酰肉碱水平显著高于100周龄大鼠,而L-犬尿氨酸、N-乙酰瓜氨酸、牛磺酸和3-羟基十二烷二酸则显著低于100周龄大鼠(图4A-4L)。特别值得注意的是,我们发现这些已鉴定的代谢物在负离子模式下位于第8或9簇,在阳离子模式下位于第3或4簇(表1),表明这些已鉴定的代谢物可能是反映衰老轨迹的可靠生物标志物。表1 正负离子模式下鉴定的尿液生物标志物
X轴上的1、2、3和4分别表示为20周、25周、50周、75周和100周。(A-F)试验组正负离子模式下的代谢物归一化丰度图,包括(A)肾上腺素、(B)戊二酰肉碱、(C)L-犬尿氨酸、(D)N-乙酰瓜氨酸、(E)牛磺酸和(F)3-羟基十二烷二酸(3OHDC12)。(G-L)训练组正负离子模式下代谢物的归一化丰度图包括(G)肾上腺素(H)戊二酰肉碱、(I)L-犬尿氨酸、(J)N-乙酰瓜氨酸、(K)牛磺酸和(L)3-羟基十二烷二酸(3OHDC12),(G)肾上腺素(H)戊二酰肉碱、(I)L-犬尿氨酸、(J)N-乙酰瓜氨酸、(K)牛磺酸和(L)3-羟基十二烷二酸(3OHDC12)。(对于测试组和训练组中的6个候选代谢物,在25周和100周之间进行比较,P <0.0001;单因素方差分析)。
5. 衰老相关的生物标志物与大鼠肿瘤的发生
鉴于我们观察到许多大鼠在长期喂养期间携带自发性肿瘤(表2),确定衰老和肿瘤之间是否存在机制联系是很有趣的。虽然在25周龄的大鼠中我们没有发现肿瘤,但一些大鼠在25周后出现了肿瘤。因此,我们首先选择了25周龄的大鼠来探讨衰老相关的代谢物与未来肿瘤发生(预测肿瘤)之间的关系。肾上腺素、戊二酰肉碱、L-犬尿氨酸、牛磺酸和N-乙酰瓜氨酸在无肿瘤大鼠和有肿瘤大鼠之间没有差异,而有肿瘤大鼠的3-羟基十二烷二酸水平高于无肿瘤大鼠(图5A-5F)。为了进一步研究衰老相关代谢物对肿瘤的潜在贡献,我们对100周龄的大鼠进行了分析。并发现与无肿瘤大鼠相比,有肿瘤大鼠肾上腺素、戊二酰肉碱、L-犬尿氨酸、牛磺酸和3-羟基十二烷二酸水平无明显差异,但N-乙酰瓜氨酸水平明显升高(图5G-5L)。
在25周时,X轴上的0和1分别代表无肿瘤大鼠和有肿瘤大鼠。在100周时,X轴上的0和1分别代表无肿瘤大鼠和有肿瘤大鼠。(A-F)是25周时正负离子代谢物的标准丰度图,包括(A)肾上腺素、(B)戊二酰肉碱、(C)L-犬尿氨酸、(D)N乙酰瓜氨酸、(E)牛磺酸和(F)3-羟基十二烷二酸(3OHDC12)。(G-L)100周时正负离子模式下代谢物的归一化丰度图,(G)肾上腺素(H)戊二酰肉碱、(I)L-犬尿氨酸、(J)N-乙酰瓜氨酸、(K)牛磺酸和(L)3-羟基十二烷二酸(3OHDC12) (P<0.05被认为具有统计学意义;t检验)。 表2 由兽医病理学家确定的大鼠肿瘤病理分类
讨论
----------微科盟更多推荐----------
长按左侧二维码 进入生科云 | |
生科云所有分析工具可以免费使用,不收取任何直接或间接费用;您还可以在微信上联系微生态老师,随时获取免费的指导,帮助您解决分析时遇到的问题;专业的生信分析团队,持续添加、更新、优化生信云上的分析工具,集成多种生信分析流程,一键批量生成主流科研图,帮您节省时间,有更多的时间探究生物学意义。 |
----------微科盟精彩文章----------
科研 | Aging :注射用小牛血去蛋白提取物缓解阿尔兹海默症的机制研究(国人佳作)
科研 | 福建医科大学:基于多组学的人工智能建模技术在炎症性肠病无创诊断中的应用(国人佳作)
如果需要原文pdf,请扫描文末二维码,加助理获取
代谢组metabolome期待与您交流更多代谢组学问题
(联系代谢组学老师即可申请入群)
请关注下列二维码
了解更多代谢组学知识